La dimensión de vivienda y servicios públicos mide dentro de la encuesta de calidad de vida como viven los Medellinenses, en que condiciones estan sus hogares a nivel de tipo de vivienda y sus características fisicas, materialesl de paredes y pisos tenencias, financiación de la viviend,: tipo de tenencia de la vivienda; tenencia de escritura de propiedad; subsidios recibidos para la compra, construcción, mejora, titulación o escrituración de la vivienda

Para el análisis de la dimensión de VIVIENDA Y SERVICIOS PUBLICOS en los barrios de Medellín se toman las siguientes preguntas con sus respectivos indicadores, estas preguntas son seleccionadas a la luz de descubrir si las condiciones de la dimensión aporta a la calidad de vida de los habitantes de los barrios de Medellín:

Indicador: Promedio de personas por hogar

Fórmula: Número de personas en cada hogar / Número total de hogares

Posibles respuestas:

* -99   No responde
* -98   No sabe
* -88   No aplica
* -77   Otra
* 1 Orden Público
* 2 Estudio
* 3 Búsqueda de trabajo
* 4 Venta de tierra
* 5 Razones familiares
* 6 Fénomeno natural
* 7 Motivos laborales
* 8 Razones de salud
* 9 Traslado del hogar
* 10    Nos quedaba cerca
* 11    Nos pareció atractiva

Para efectos de esta pregunta, es de interés análizar que tanto son usados los barrios cómo refugio ante problemas de orden Público en otros barrios o verdas

Indicador: Porcentaje de hogares por barrio que han llegado por problemas de orden público

Fórmula: Cantidad de hogares que llegaron al barrio por problemas de orden público / Número total de hogares

Posibles respuestas:

* -99   No responde
* -98   No sabe

Con el fin de medir la permanencia de los hogares en un barrio, se determina que 6 años es un tiempo prudente para indicar que las personas se siente cómodo en el barrio y por tal motivo permanecen en él

Indicador: Porcentaje de familias que han vivo en el barrio o vereda por más de 6 años

Fórmula: Cantidad de hogares que llevan viviendo en el barrio o vereda más de 6 años / Número total de hogares

Posibles respuestas:

* 1 Rancho o vivienda de desechos
* 2 Cuarto(s)
* 3 Cuartos en inquilinato
* 4 Apartamento
* 5 Casa

Indicador_1: Porcentaje de hogares del barrio que viven en Rancho o vivienda de desechos (1)

Indicador_2: Porcentaje de hogares del barrio que viven en Cuarto(s) (2)

Indicador_3: Porcentaje de hogares del barrio que viven en Cuartos en inquilinato (3)

Indicador_4: Porcentaje de hogares del barrio que viven en Apartamento (4)

Indicador_5: Porcentaje de hogares del barrio que viven en Casa (5)

Fórmula: Cantidad de hogares que viven en / Número total de hogares

Posibles respuestas:

* 1 Entidad prestadora de servicios públicos domiciliarios
* 2 Acueducto veredal o comunal
* 3 Pozo con bomba
* 4 Pozo sin bomba, aljibe, jaguey o barreno
* 5 Agua lluvia
* 6 Río, quebrada o manantial, nacimiento
* 7 Pila pública
* 8 Carro tanque
* 9 Aguatero
* 10 Agua embotellada o en bolsa

Para medir que tan conectados a la fácil para los hogares de la ciudad de Medellín conseguir el agua para el consumo humano, se seleccionan para la medición las opciones 1 y 2

Indicador: Porcentaje de hogares que toman el agua de entidades prestadoras de servicios públicos domiciliarios (1,2)

Fórmula: Cantidad de hogares que toman el agua de entidades prestadoras de servicios públicos domiciliarios / Número total de hogares

Posibles respuestas:

* 1 Si
* 2 No

Se construye el indicador enmarcado en determinar si los hogares tienen acceso a algún servicio público básico, se considera básicos energía, acueducto, alcantarillado, aseo

Indicador: Porcentaje de hogares con acceso a almenos uno de los servicios públicos básicos

Fórmula: Cantidad de hogares con acceso al menos uno de los servicios públicos básicos / Número total de hogares

Este indicador busca determinar en que porcentaje los hogares del municipio no tienen la posibilidad de pagar alguno de los servicios públicos agrupados en energía, acueducto, gas natural, teléfono e internet

Indicador: Porcentaje de hogares en el momento de la encuesta con algún servicios públicos suspendido (1)

Fórmula: Número de hogares con algún servicios públicos suspendido / Número total de hogares

Posibles respuestas:

* 1 Si
* 2 No

Indicador: Porcentaje de hogares con servicios públicos de Conexión a Internet (1)

Fórmula: Número de hogares con con servicios públicos de Conexión a Internet / Número total de hogares

Posibles respuestas:

* 1 En arriendo o subarriendo mensual
* 2 Propia, la están pagando mensualmente
* 3 Propia, totalmente pagada
* 4 En usufructo
* 5 Ocupante de hecho
* 6 Anticresis

Indicador_1: Porcentaje de hogares en arriendo o subarriendo mensual (1)

Indicador_2: Porcentaje de hogares en propia (2,3) .

Indicador_3: Porcentaje de hogares en otras condiciones (4,5,6)

Fórmula: Número de hogares ocupadas bajo la características de cada uno de los indicadores / Número total de hogares

El insumo principal de este trabajo son los datos abiertos del portal Medata[1] y en particular la Encuesta de Calidad de Vida Medellín Cómo vamos.

1. Caracterización de las dimensiones para la dimensión VIVIENDA Y SERVICIOS PUBLICOS

Analizando el conjunto de preguntas seleccionadas para esta dimensión, se evidencia que todas ellas fueron respondidas por los encuestados, puesto que no existen valores nulos.

Estadísticas básicas VIVIENDA Y SERVICIOS PUBLICOS

##            comuna             barrio         p_12            p_26        
##  EL POBLADO   : 22   SAN PABLO   :  3   Min.   :1.333   Min.   :0.00228  
##  ROBLEDO      : 22   EL LLANO    :  2   1st Qu.:3.144   1st Qu.:0.02949  
##  BELEN        : 21   EL SALADO   :  2   Median :3.500   Median :0.05013  
##  SAN CRISTOBAL: 21   LA ESPERANZA:  2   Mean   :3.446   Mean   :0.06946  
##  SAN JAVIER   : 19   LA FLORIDA  :  2   3rd Qu.:3.754   3rd Qu.:0.08945  
##  VILLA HERMOSA: 18   LA PALMA    :  2   Max.   :4.444   Max.   :0.33880  
##  (Other)      :187   (Other)     :297                   NA's   :35       
##       p_30           p_146_1           p_146_2           p_146_3       
##  Min.   :0.2561   Min.   :0.00073   Min.   :0.00121   Min.   :0.00096  
##  1st Qu.:0.6682   1st Qu.:0.00251   1st Qu.:0.00432   1st Qu.:0.00231  
##  Median :0.7382   Median :0.00826   Median :0.00619   Median :0.00311  
##  Mean   :0.7195   Mean   :0.01356   Mean   :0.01312   Mean   :0.00577  
##  3rd Qu.:0.7843   3rd Qu.:0.01852   3rd Qu.:0.01129   3rd Qu.:0.00521  
##  Max.   :1.0000   Max.   :0.08511   Max.   :0.33333   Max.   :0.04762  
##  NA's   :1        NA's   :261       NA's   :127       NA's   :245      
##     p_146_4           p_146_5            p_149             p_SP       
##  Min.   :0.07407   Min.   :0.02155   Min.   :0.6071   Min.   :0.1556  
##  1st Qu.:0.52805   1st Qu.:0.27375   1st Qu.:0.9888   1st Qu.:0.9145  
##  Median :0.63500   Median :0.35847   Median :0.9990   Median :0.9685  
##  Mean   :0.61220   Mean   :0.39703   Mean   :0.9782   Mean   :0.8969  
##  3rd Qu.:0.72866   3rd Qu.:0.47640   3rd Qu.:1.0000   3rd Qu.:0.9838  
##  Max.   :1.00000   Max.   :1.00000   Max.   :1.0000   Max.   :1.0000  
##  NA's   :9         NA's   :2                                          
##      p_SPS             p_178            p_226_1           p_226_2      
##  Min.   :0.02174   Min.   :0.03571   Min.   :0.07143   Min.   :0.1892  
##  1st Qu.:0.06149   1st Qu.:0.36346   1st Qu.:0.28603   1st Qu.:0.5325  
##  Median :0.08341   Median :0.51264   Median :0.35000   Median :0.5793  
##  Mean   :0.08691   Mean   :0.53196   Mean   :0.34257   Mean   :0.5936  
##  3rd Qu.:0.10582   3rd Qu.:0.69951   3rd Qu.:0.39198   3rd Qu.:0.6429  
##  Max.   :0.28125   Max.   :1.00000   Max.   :1.00000   Max.   :1.0000  
##  NA's   :20        NA's   :3         NA's   :5         NA's   :1       
##     p_226_3        
##  Min.   :0.008621  
##  1st Qu.:0.048632  
##  Median :0.066667  
##  Mean   :0.076476  
##  3rd Qu.:0.090909  
##  Max.   :0.428571  
##  NA's   :17

Una vez cálculado los indicadores para las hogares encuestados, se tiene que en promedio hay 3.4 personas por hogar, las personas de Medellín no cambian mucho de barrio, permanecen en sus barrios por varios años, un 70% de ellos en promedio llevan vivendo en sus barrios por más de 6 años. La población vive en mayor medida en casas y apartamentos y cuentan con servicios públicos básicos, se podría concluir que muchos de ellos, al menos la mitad tienen casa propia, ya pagada o pagandola actualmente.

Para efectos de la ejecución de los modelos y demás anás, los valores del data frame ECV_VIVIENDA_BARRIO que sean nulos se llenan con 0 dado que cuando se presenta un valor NAN significa que el indicador no aplica para el barrio y el cero lo representa

A partir de la gráafica anterior se puede indicar que existe una relación lineal entre los hogares cuya vivienda no es propia o arrendada con respecto a contar con los servicios públicos básicos, esto quiere decir que estos hogares siempre van a tener acceso a los servicios públicos, otras conclusiones serín que entre mayor casas menor apartmentos hay en el municipio y en la misma dirección los hogares arrendados y propios

2. Agrupamientos

Con aras de determinar si las preguntas seleccionadas en la dimensión aportan al futuro modelo de agrupamiento, se busca reducir las preguntas a aquellas que representen más en el análisis, esto se realiza a través del modelo de componentes principales (PCA)

De aquí los 3 primeros componentes se destacan antes de que haya una caída notable en la varianza

Ahora, revisemos cuales preguntas estan contribuyendo a cada uno de esos 9 componentes, seleccionando de cada componente las 6 preguntas contribuyentes

En conclusión la mayor parte de la variación de las respuestas de la encuesta para la dimensión Vivienda y servicios públicos, ocurre en solo 3 dimensiones que reunen las siguientes preguntas:

Con estas nueva selección de preguntas, procederemos a realizar el agrupamiento

Si bien, la mayoría de los indicadores del dataframe ECV_VIVIENDA_BARRIO se encuentran en función de hogares existe un indicador en función de personas del hogar, por lo tanto es necesario poner todos los indicadores en la misma escala

Se utilizan diferentes métodos para determinar el k óptimo a utilizar en el algoritmo de clusterización - Kmeans

De acuerdo a las gráficas de los diferentes métodos, se concluye que k = 3, es el k óptimo para la dimensión VIVIENDA Y SERVICIOS PUBLICOS, por lo cual aplicaremos el algoritmo Kmeans con dicho valor de k

El modelo da un ajuste del 60.3% con k = 3, es un ajuste aceptable y se procede concluir de los grupos dados.

Según el algoritmo, se generaron 3 grupos distribuidos de la siguiente forma :

## # A tibble: 3 x 2
##   cluster barrios
##     <int>   <int>
## 1       1     170
## 2       2      97
## 3       3      40

Visualizando los grupos

Análisis para cada uno de los grupos

Grupo 1

##            comuna              barrio         p_12            p_26        
##  VILLA HERMOSA:17   LA ESPERANZA  :  2   Min.   :3.303   Min.   :0.00000  
##  ROBLEDO      :16   SAN PABLO     :  2   1st Qu.:3.531   1st Qu.:0.04635  
##  MANRIQUE     :15   AGUAS FRÍAS   :  1   Median :3.678   Median :0.07189  
##  ARANJUEZ     :14   ALDEA PABLO VI:  1   Mean   :3.699   Mean   :0.08744  
##  CASTILLA     :14   ALFONSO LÓPEZ :  1   3rd Qu.:3.841   3rd Qu.:0.11233  
##  SAN JAVIER   :14   ALTAVISTA     :  1   Max.   :4.328   Max.   :0.33880  
##  (Other)      :82   (Other)       :164                                    
##     p_146_2            p_146_4          p_146_5            p_149       
##  Min.   :0.000000   Min.   :0.2083   Min.   :0.08621   Min.   :0.8258  
##  1st Qu.:0.001936   1st Qu.:0.5321   1st Qu.:0.33300   1st Qu.:0.9873  
##  Median :0.005265   Median :0.6105   Median :0.37696   Median :0.9982  
##  Mean   :0.006569   Mean   :0.5918   Mean   :0.39720   Mean   :0.9883  
##  3rd Qu.:0.009320   3rd Qu.:0.6602   3rd Qu.:0.45273   3rd Qu.:1.0000  
##  Max.   :0.034722   Max.   :0.9138   Max.   :0.79167   Max.   :1.0000  
##                                                                        
##       p_SP            p_SPS             p_178           p_226_1      
##  Min.   :0.5556   Min.   :0.00000   Min.   :0.1407   Min.   :0.1947  
##  1st Qu.:0.9282   1st Qu.:0.07584   1st Qu.:0.3466   1st Qu.:0.3298  
##  Median :0.9648   Median :0.09777   Median :0.4583   Median :0.3607  
##  Mean   :0.9384   Mean   :0.09500   Mean   :0.4564   Mean   :0.3690  
##  3rd Qu.:0.9793   3rd Qu.:0.11592   3rd Qu.:0.5560   3rd Qu.:0.3988  
##  Max.   :1.0000   Max.   :0.24138   Max.   :0.7868   Max.   :0.8000  
##                                                                      
##     p_226_2          cluster 
##  Min.   :0.1892   Min.   :1  
##  1st Qu.:0.5206   1st Qu.:1  
##  Median :0.5564   Median :1  
##  Mean   :0.5537   Mean   :1  
##  3rd Qu.:0.5868   3rd Qu.:1  
##  Max.   :0.7632   Max.   :1  
## 

Barrios donde conviven las casas y los apartamentos, en promedio el 59% de los hogares viven en casas y el 37% en apartamentos, con un promedio de 3.7 habitantes por hogar, sus propiedades en más del 55% son propias, casi todos los hogares toman el agua de las entidades prestadoras de servicios públicos y tienen acceso a los servicios públicos básicos, muy pocos (9%) de los que tienen acceso a los servicios públicos lo tienen suspendido. Solo el 45% de los hogares tienen acceso a internet. Pocos de los hogares de este grupo llegaron aquí por problemas de orden público.

Grupo 2

##               comuna                               barrio  
##  EL POBLADO      :22   ALEJANDRÍA                     : 1  
##  BELEN           :17   ALEJANDRO ECHAVARRÍA           : 1  
##  LAURELES-ESTADIO:15   ALTAMIRA                       : 1  
##  LA CANDELARIA   :12   ALTOS DEL POBLADO              : 1  
##  LA AMERICA      :11   AREA DE EXPANCION SAN CRISTOBAL: 1  
##  ROBLEDO         : 6   ÁREA DE EXPANSIÓN BELÉN RINCÓN : 1  
##  (Other)         :14   (Other)                        :91  
##       p_12            p_26            p_146_2            p_146_4      
##  Min.   :1.333   Min.   :0.00000   Min.   :0.000000   Min.   :0.5179  
##  1st Qu.:2.837   1st Qu.:0.01397   1st Qu.:0.000000   1st Qu.:0.6976  
##  Median :2.984   Median :0.02459   Median :0.000000   Median :0.7753  
##  Mean   :2.969   Mean   :0.02566   Mean   :0.006093   Mean   :0.7807  
##  3rd Qu.:3.151   3rd Qu.:0.03448   3rd Qu.:0.004310   3rd Qu.:0.8667  
##  Max.   :3.355   Max.   :0.09524   Max.   :0.333333   Max.   :1.0000  
##                                                                       
##     p_146_5           p_149             p_SP            p_SPS        
##  Min.   :0.0000   Min.   :0.9878   Min.   :0.6667   Min.   :0.00000  
##  1st Qu.:0.1189   1st Qu.:0.9958   1st Qu.:0.9725   1st Qu.:0.04630  
##  Median :0.2184   Median :1.0000   Median :0.9836   Median :0.05970  
##  Mean   :0.2122   Mean   :0.9980   Mean   :0.9748   Mean   :0.06226  
##  3rd Qu.:0.2920   3rd Qu.:1.0000   3rd Qu.:0.9888   3rd Qu.:0.07432  
##  Max.   :0.4777   Max.   :1.0000   Max.   :1.0000   Max.   :0.15385  
##                                                                      
##      p_178           p_226_1          p_226_2          cluster 
##  Min.   :0.3333   Min.   :0.0000   Min.   :0.0000   Min.   :2  
##  1st Qu.:0.6853   1st Qu.:0.2561   1st Qu.:0.5595   1st Qu.:2  
##  Median :0.7688   Median :0.3250   Median :0.6205   Median :2  
##  Mean   :0.7603   Mean   :0.3342   Mean   :0.6170   Mean   :2  
##  3rd Qu.:0.8444   3rd Qu.:0.3917   3rd Qu.:0.6951   3rd Qu.:2  
##  Max.   :1.0000   Max.   :1.0000   Max.   :0.9231   Max.   :2  
## 

En promedio hay 2.9 habitantes por hogar en los barrios de este grupo, viviendo mayormente en apartamentos, un 78% de la población de este grupo en gran medida propios (61%), en donde el agua es tomada de las entidades prestaras de servicios públicos y cuenta con acceso a los servicios públicos básicos e internet en un 76%.

Grupo 3

##                   comuna                      barrio        p_12      
##  SAN CRISTOBAL       :13   EL LLANO              : 2   Min.   :2.909  
##  SANTA ELENA         :10   BARRO BLANCO          : 1   1st Qu.:3.211  
##  PALMITAS            : 8   BOQUERÓN              : 1   Median :3.438  
##  SAN ANTONIO DE PRADO: 7   CORREGIMIENTO PALMITAS: 1   Mean   :3.517  
##  ALTAVISTA           : 2   EL ASTILLERO          : 1   3rd Qu.:3.800  
##  VILLA HERMOSA       : 1   EL CARMELO            : 1   Max.   :4.444  
##  (Other)             : 0   (Other)               :34                  
##       p_26            p_146_2          p_146_4           p_146_5      
##  Min.   :0.00000   Min.   :0.0000   Min.   :0.00000   Min.   :0.5625  
##  1st Qu.:0.00000   1st Qu.:0.0000   1st Qu.:0.08065   1st Qu.:0.7500  
##  Median :0.01613   Median :0.0000   Median :0.16667   Median :0.8169  
##  Mean   :0.03839   Mean   :0.0166   Mean   :0.16458   Mean   :0.8143  
##  3rd Qu.:0.03846   3rd Qu.:0.0000   3rd Qu.:0.22222   3rd Qu.:0.9091  
##  Max.   :0.30496   Max.   :0.3333   Max.   :0.43750   Max.   :1.0000  
##                                                                       
##      p_149             p_SP            p_SPS             p_178       
##  Min.   :0.6071   Min.   :0.1556   Min.   :0.00000   Min.   :0.0000  
##  1st Qu.:0.8415   1st Qu.:0.3478   1st Qu.:0.00000   1st Qu.:0.1364  
##  Median :0.9091   Median :0.5333   Median :0.06383   Median :0.2636  
##  Mean   :0.8891   Mean   :0.5384   Mean   :0.06888   Mean   :0.2700  
##  3rd Qu.:1.0000   3rd Qu.:0.6667   3rd Qu.:0.09524   3rd Qu.:0.3714  
##  Max.   :1.0000   Max.   :1.0000   Max.   :0.28125   Max.   :1.0000  
##                                                                      
##     p_226_1          p_226_2          cluster 
##  Min.   :0.0000   Min.   :0.3333   Min.   :3  
##  1st Qu.:0.1333   1st Qu.:0.5938   1st Qu.:3  
##  Median :0.1915   Median :0.7000   Median :3  
##  Mean   :0.2099   Mean   :0.6913   Mean   :3  
##  3rd Qu.:0.2812   3rd Qu.:0.7895   3rd Qu.:3  
##  Max.   :0.6667   Max.   :1.0000   Max.   :3  
## 

Barrios con promedio de 3.5 personas por hogar, donde predominan las casas en un 81% en promedio del grupo, solo el 53% de la población cuentan con servicios páblicos básicos, el 6% de ellos estan suspendidos y solo el 27% tienen acceso a internet. Las casas en donde vivien son propias y un 3% de los hogares llegaron al barrio por problemas de orden público.

Conozcamos algunos barrios que pertenecen a cada uno de estos grupos

## [1] AGUAS FRÍAS                 ALTAVISTA CENTRAL          
## [3] ÁREA DE EXPANSIÓN ALTAVISTA BUGA PATIO BONITO          
## [5] CABECERA ALTAVISTA          EL JARDÍN                  
## 299 Levels: AGUAS FRÍAS ALDEA PABLO VI ALEJANDRÍA ... YARUMALITO
## [1] ÁREA DE EXPANSIÓN BELÉN RINCÓN BELÉN                         
## [3] CERRO NUTIBARA                 DIEGO ECHAVARRÍA              
## [5] EL NOGAL - LOS ALMENDROS       FÁTIMA                        
## 299 Levels: AGUAS FRÍAS ALDEA PABLO VI ALEJANDRÍA ... YARUMALITO
## [1] EL CORAZÓN EL MORRO     SAN JOSÉ DEL MANZANILLO CORREGIMIENTO PALMITAS 
## [4] LA ALDEA                LA FRISOLA              LA SUCIA               
## 299 Levels: AGUAS FRÍAS ALDEA PABLO VI ALEJANDRÍA ... YARUMALITO

Características que distinguen un grupo de barrios de otro

En términos generales, no es muy común para ninguno de los tres grupos vivir en cuartos y tener los servicios publicos suspendidos.

3. Análisis espacial

Se cargan las subdivisiones territoriales de Medellín, tomadas de la página web de opendata[2]

## OGR data source with driver: ESRI Shapefile 
## Source: "/Users/yosel/Desktop/Especializacion/AprendizajeEstadistico/Agrupamiento/Taller 01/TAE_T1/dataSet/Barrio_Vereda/Barrio_Vereda.shp", layer: "Barrio_Vereda"
## with 332 features
## It has 6 fields
## Integer64 fields read as strings:  OBJECTID SUBTIPO_BA

Se procede a dibujar el mapa de Medellín señalando cada uno de los barrios a que cluster pertenece

Espacialmente se evidencia que para la dimensión VIVIENDA Y SERVICIOS PUBLICOS los grupos se distribuyen en el mapa sectorizado en la mayoría de los casos

Referencias [1] Encuesta calidad de vida. http://medata.gov.co/dataset/encuesta-calidad-de-vida [2] Barrio Vereda. https://geomedellin-m-medellin.opendata.arcgis.com/datasets/c844f0fd764f41b2a808d8747457de8a_4